@张博 张茜:《从词频符频探测学术汉语的若干语言特征》

研究范式与目的

研究语料与方法

核心发现

词汇与语体特征 (基于词频)

  1. 单音节词占比高,语体偏“文”

    • 表现:
      • 学术汉语平均词长更短。
      • 高频词中,单音节词多于报刊语料。
      • 偏好使用具有文言/庄典色彩的单音节词,如 (vs. 购买), (vs. 必须), (vs. 没有)。
    • 规律: 存在“以单求单”的搭配倾向,即单音节词倾向于和另一个单音节词搭配。
    • 结论: 语体风格比通用书面语更正式、典雅
  2. 高频词意义/用法特殊

    • 现象: 许多在通用语和学术语中都高频的词,其主要意义或用法有显著差异。
    • 示例:
      • : 学术语中常用作介词,构成比较结构 (如 较之于...)。
      • 区域: 学术语中可指“物体或图像的一部分”或“变化的范围”,超出了通用语中“地区范围”的意义。
      • 响应: 学术语中常指“系统因刺激而产生的反应”,为物理或生物学概念。
    • 意义: 这是学习者理解学术文本的关键难点

语法特征 (基于词频与符频)

  1. 定语繁复

    • 线索: 结构助词的频率远高于报刊。
    • 原因: 为追求精确性信息密度,名词核心语常带有复杂、多层的修饰成分。
    • 特征: 多重定语普遍,且内部关系复杂 (并列、偏正关系叠加)。
  2. 动词时体特征不凸显

    • 线索: 体助词的使用频率显著低于报刊。
    • 原因:
      • 语体: 学术语体以说明论证为主,叙事性弱。
      • 内容: 侧重阐述普遍规律研究发现,时间性模糊。
      • 风格: 追求简洁精炼,省略非概念意义的语法标记。
  3. 复句使用频繁且复杂

    • 线索: 各类关联词频率普遍更高。
    • 特征:
      • 类型: 因果转折类复句尤为常用。
      • 结构: 句子内部结构层次多,存在大量多层复句。
      • 选词: 倾向于使用更具文言色彩和书面色彩的关联词 (如 由于...因此, , 即使)。

句法与表达特征 (基于符频)

  1. 句子长,句法复杂

    • 线索: 句末标点 ( ? !) 频率低,而句中标点 (特别是) 频率高。
    • 结论: 学术汉语的句子平均长度更长,内部句法结构更复杂。
  2. 疑问句少,但疑问小句和正反问多

    • 线索: 问号 ? 频率极低。
    • 原因: 学术语篇追求客观陈述,避免直接提问和强烈情感。
    • 特征:
      • 疑问词 (如何, 怎样) 常用于陈述句中,构成疑问小句,充当主语或宾语。
      • 广泛使用“X 否”形式的正反选择问 (是否, 能否, 应否),以体现客观、审慎的探讨姿态。
  3. 括号功能丰富多样

    • 线索: 圆括号 () 的使用频率极高。
    • 首要功能: 标示引文出处 (西式学术规范)。
    • 其他功能: 补充说明、补充、确指、强调、举例、标示外语原词等。

结论